AI资讯新闻榜单内容搜索- DeepSeek

让动态投机解码不再局限于DSpark：LightSpec首个开源动态MTP系统实现

随着 DeepSeek 发布 DSpark，动态 MTP（多 Token 预测）成为了对抗高并发、提升 GPU 利用率的绝对焦点。然而，DSpark 高度绑定特定模型且需要额外训练。

来自主题: AI技术研报

8881 点击 2026-07-17 10:08

ISSTA 2026｜LAVE：面向扩散语言模型的约束解码

推理大模型 (如 DeepSeek-R1、o1) 靠长思维链拿高分，却普遍「想太多」: 研究统计了五个代表性模型里，发现有 41–52% 的 token 是在模型给出它的最终答案之后生成的。

来自主题: AI技术研报

8698 点击 2026-07-16 10:09

用推理步骤的「语义冗余」给LRM过度思考踩刹车

推理大模型 (如 DeepSeek-R1、o1) 靠长思维链拿高分，却普遍「想太多」: 研究统计了五个代表性模型里，发现有 41–52% 的 token 是在模型给出它的最终答案之后生成的。

来自主题: AI技术研报

5585 点击 2026-07-16 10:08

DeepSeek 拟 IPO！单月估值猛增 1500 亿，梁文锋成 AI 创业首富，市场在赌什么？

过去 12 个小时，关于 DeepSeek 的消息一个接一个炸出来。

来自主题: AI资讯

7780 点击 2026-07-15 11:37

2.5万亿参数！Kimi K3确认本月发布，参数量超越DeepSeek V4 Pro

月之暗面旗下新一代大模型 Kimi K3 已由员工在 X 上确认，将于本月内发布。据多方信源，K3 的参数规模将达到 2.5 万亿——这一数字不仅超越了 DeepSeek V4 Pro 的 1.6 万亿，也成为当前已公开参数规模最大的国产模型。

来自主题: AI资讯

10226 点击 2026-07-06 10:59

清华特奖获得者顾煜贤，加入DeepSeek

就我们所知，顾煜贤已经正式加入了 DeepSeek。顾煜贤还曾获得 2025 年度苹果博士奖学金以及蚂蚁 In-Tech 奖学金。个人主页显示，顾煜贤在清华大学交互式人工智能课题组（Conversational AI, CoAI）学习，师从黄民烈教授。

来自主题: AI资讯

9165 点击 2026-07-05 14:04

ZenMux 的 Token 经济学实验：当主流模型的价格被降到 DeepSeek 斩杀线，你会选择谁？

你有没有想过一个问题：我们平时选模型，到底有多少是因为它真的好用，又有多少是因为它便宜？

来自主题: AI产品测评

9802 点击 2026-06-30 09:55

刚刚，DeepSeek V4更新DSpark，推理速度提升80%

刚刚，DeepSeek V4 进行了一次更新。新推出了投机解码（Speculative Decoding）框架 DSpark，并同步开源了支撑该版本的全栈推测性解码框架 DeepSpec。DeepSeek-V4-Pro-DSpark 并非全新架构模型，而是在 DeepSeek-V4-Pro 基础上引入了推测性解码模块。此次更新的重点在于工程落地，而非模型能力本身的迭代。

来自主题: AI技术研报

9563 点击 2026-06-27 18:55

扒开1604份招聘，DeepSeek们最狠的大招藏在招人里

同样是进顶尖 AI 公司当工程师，在中国你只要 1.6 年经验，在美国却得熬到 5.5 年。换句话说，一个中国应届生刚拿到毕业证，就可能坐在 DeepSeek 的工位上调大模型；而他的美国同行还得在别的公司再「实习」四年，才够格投一份前沿 AI 实验室的简历。

来自主题: AI资讯

8347 点击 2026-06-27 12:26

美国版「幻方量化」，没做 DeepSeek，但押注 Anthropic 爆赚 50 倍

可能是全球首家「AI 原生金融组织」。

来自主题: AI资讯

9375 点击 2026-06-22 15:15